“内容过滤/基于内容的过滤”:一种推荐或筛选方法,根据物品自身的内容特征(如文本关键词、主题、标签、类别、音频/图像特征等)与用户过去喜欢的内容相似度,来推断用户可能喜欢的新内容。常用于推荐系统、信息检索与个性化推送。(也可用于垃圾内容筛查等场景。)
/ˈkɑnˌtɛnt beɪst ˈfɪltərɪŋ/
I prefer content-based filtering because it recommends articles similar to what I’ve read.
我更喜欢基于内容的过滤,因为它会推荐与我读过的文章相似的内容。
In a news app, content-based filtering can model a user’s interests from reading history and then rank new stories by textual similarity and topic features.
在新闻应用中,基于内容的过滤可以从用户的阅读历史建模兴趣,再按文本相似度与主题特征对新文章进行排序。
该术语由“content-based(基于内容的)”与“filtering(过滤/筛选)”组合而来。20世纪90年代推荐系统研究兴起后,“content-based filtering”逐渐成为与“collaborative filtering(协同过滤)”并列的核心方法名称,用来强调:推荐依据主要来自“物品内容特征”,而不是“其他用户的行为”。